home *** CD-ROM | disk | FTP | other *** search
/ Amiga Plus 1995 #2 / Amiga Plus CD - 1995 - No. 2.iso / internet / faq / englisch / biologicalinformation < prev    next >
Encoding:
Text File  |  1995-04-11  |  32.7 KB  |  893 lines

  1. Archive-name: biology/info-theory
  2.  
  3. ***********************************************************
  4.  
  5. Replies to Frequently Asked Questions (FAQ) for bionet.info-theory
  6.  
  7.              Biological Information Theory and Chowder Society
  8.  
  9. version = 1.71 of bionet.info-theory.faq  1995 March 8
  10.  
  11. ***********************************************************
  12. |-| What is the History of The Biological Information Theory and Chowder Society?
  13. |-| What Kind of Questions Are Appropriate For Discussion?
  14. |-| Is There a Quick Introduction to Information Theory Somewhere?
  15. |-| I'm Confused: How Could Information Equal Entropy?
  16. |-| How Can I Learn More About Information Theory and Biology?  References
  17. |-| Will Authors Send Me Papers?
  18. |-| How Do I find Sequence Logos on the Web?
  19. |-| Is There a Shell Script for Making Sequence Logos?
  20. |-| Is There a Mosaic Page for Making Sequence Logos?
  21. |-| Can You Just Point My Mosaic To The FAQ and the Archives?
  22. |-| How Do I obtain bionet.info-theory BY EMAIL?
  23. |-| Where Did I Get This FAQ File From Originally?
  24. |-| What is the IP number of the FAQ archive?
  25. |-| Where Are the Bionet Archives?
  26. |-| What Can I Do About Inappropriate Postings?
  27. |-| What is the official word on copyright of this FAQ?
  28. |-| Who Takes Care of This Group?
  29. |-|
  30. ***********************************************************
  31.  
  32. |-| What is the History of The Biological Information Theory and Chowder Society?
  33.  
  34. The Biological Information Theory and Chowder Society (BITCS) is a group of
  35. scientists interested in the biological applications of information theory
  36. (thus the "BIT") who meet informally for dinner (thus the "CS") from time to
  37. time in the Washington, DC, area.  At our dinners we have only one rule ---
  38. food fights are discouraged.
  39.  
  40. The guys who started this thing did it because we weren't certain we understood
  41. the biological implications of information theory.  Some of us are more
  42. comfortable with the mathematical machinery and assemble biological systems
  43. into grand canonical ensembles whether they want to be there or not; and some
  44. of us think they understand what the biological systems are doing but can't
  45. take a log to base 2.  What we try to do is pry from one another the bits of
  46. knowledge that will help us understand what's going on.
  47.  
  48. Some of the topics up for discussion in our group are:
  49.   biological applications of information theory
  50.   biochemical molecular machines
  51.   computer methods for recognition of molecular structure and function
  52.   database organization for biomolecular information
  53.   nanotechnology
  54.   the limits of computation
  55.   "dissipationless" (?) computation
  56.   Maxwell's demon
  57.   anecdotes and humor about all these topics
  58. A few relevant papers are listed below.
  59.  
  60. The group started when Tom Schneider was introduced to John Spouge in 1988.
  61. Tom bounced his ideas about molecular machines off John, and John kept finding
  62. flaws.  Tom would go away rather unhappily for a month and then find a
  63. solution.  But John was always one step ahead...  (and still is, on last
  64. account.)  Tom gave a talk about molecular machines at the Lambda Lunch meeting
  65. on the Bethesda NIH campus, and John introduced John (Steve) Garavelli.  We all
  66. got together with Peter Basser for dinner once in a while to talk about
  67. information theory.  Steve brought in one of the first people to apply
  68. information theory to biology, Hubert Yockey.  Steve Garavelli dubbed the group
  69. the "Biological Information Theory and Chowder Society", which it is still
  70. called.  We are known sometimes as 'chowderheads', and talk about food fights,
  71. but so far have only had electronic food fights!  We hold dinners in Bethesda
  72. Maryland on random occasions.
  73.  
  74. When our informal mailing list became difficult to handle, we petitioned to
  75. start a bionet news group.  We hope to hold roaring discussions, and everyone
  76. is welcome to join.  If you are uncertain about something, quit lurking and ask
  77. on the net.  It may well be that what bothered you is the key to a new piece of
  78. information theory in biology.  (The major advances so far have been by things
  79. that REALLY bugged people.)
  80.  
  81. We will also announce when and where our (irregular) eatings are and you are
  82. welcome to join if the travel is not too far.  John Spouge
  83. (spouge@ncbi.nlm.nih.gov), usually makes the arrangements.
  84.  
  85. ***********************************************************
  86.  
  87. |-| What Kind of Questions Are Appropriate For Discussion?
  88.  
  89. This faq sheet answers simple questions about this group.  The BIG questions
  90. should be discussed on the net, where we can all haggle over them.  Here are a
  91. few for starters:
  92.  
  93. What is the role of theory in biology today?
  94. What should be the role of biological theory?
  95.  
  96. What is information?  How should it be defined?
  97.  
  98. What bothers you when you read the two papers on the theory of molecular
  99. machines?  (It is only from the things that bother us that we can make progress
  100. in understanding.)  (See references below.)
  101.  
  102. What are flaws in the theory of molecular machines?
  103.  
  104. How is ATP used to drive molecular machines?
  105.  
  106. All communication systems are associated with living things, so is it true that
  107. information theory is really a theory about living things?  Was Shannon really
  108. a great biologist?
  109.  
  110. What does Maxwell's Demon have to do with all of this?
  111.  
  112. What are the limits of computers?
  113.  
  114. What are the limits of nanotechnology?
  115.  
  116. ***********************************************************
  117.  
  118. |-| Is There a Quick Introduction to Information Theory Somewhere?
  119.  
  120. See the primer on information theory:
  121. ftp://ftp.ncifcrf.gov/pub/delila/primer.ps
  122.  
  123. ***********************************************************
  124.  
  125. |-| I'm Confused: How Could Information Equal Entropy?
  126.  
  127. If someone says that information = uncertainty = entropy, then they are
  128. confused, or something was not stated that should have been.  Those equalities   
  129. lead to a contradiction, since entropy of a system increases as the system   
  130. becomes more disordered.  So information corresponds to disorder according to
  131. this confusion.
  132.  
  133. If you always take information to be a decrease in uncertainty at the receiver
  134. and you will get straightened out:
  135.  
  136. R = Hbefore - Hafter.
  137.  
  138. where H is the Shannon uncertainty:
  139.  
  140. H = - sum (from i = 1 to number of symbols) Pi log2 Pi (bits per symbol)
  141.  
  142. and Pi is the probability of the ith symbol.  If you don't understand this,
  143. please refer to "Is There a Quick Introduction to Information Theory
  144. Somewhere?".
  145.  
  146. Imagine that we are in communication and that we have agreed on an alphabet.
  147. Before I send you a bunch of characters, you are uncertain (Hbefore) as to what
  148. I'm about to send.  After you receive a character, your uncertainty goes down
  149. (to Hafter).  Hafter is never zero because of noise in the communication
  150. system.  Your decrease in uncertainty is the information (R) that you gain.
  151.  
  152. Since Hbefore and Hafter are state functions, this makes R a function of
  153. state.  It allows you to lose information (it's called forgetting).  You can
  154. put information into a computer and then remove it in a cycle.
  155.  
  156. Many of the statements in the early literature assumed a noisess channel, so
  157. the uncertainty after receipt is zero (Hafter=0).  This leads to to the SPECIAL
  158. CASE where R = Hbefore.  But Hbefore is NOT "the uncertainty", it is the
  159. uncertainty of the receiver BEFORE RECEIVING THE MESSAGE.
  160.  
  161. A way to see this is to work out the information in a bunch of DNA binding
  162. sites.  Here is an aligned listing of the binding sites for the cI and cro
  163. proteins of the bacteriophage (ie, virus) named lambda:
  164.  
  165. alist 5.21 aligned listing of:
  166. * 92/10/04 23:17:10, 91/02/05 15:07:18, lambda.ci.cro
  167. The book is from:   0 to 0
  168. This alist list is from: -30 to 30
  169. The alignment is by delila instructions
  170.  
  171.      ---------------------                   +++++++++++++++++++++
  172.      322222222221111111111--------- +++++++++111111111122222222223
  173.      0987654321098765432109876543210123456789012345678901234567890
  174.      .............................................................
  175.    1 tgcgtcctgctgatgtgctcagtatcaccgccagtggtatttatgtcaacaccgccagaga
  176.    2 tctctggcggtgttgacataaataccactggcggtgatactgagcacatcagcaggacgca
  177.    3 tcaccgccagtggtatttatgtcaacaccgccagagataatttatcaccgcagatggttat
  178.    4 ataaccatctgcggtgataaattatctctggcggtgttgacataaataccactggcggtga
  179.    5 gtcaacaccgccagagataatttatcaccgcagatggttatctgtatgttttttatatgaa
  180.    6 ttcatataaaaaacatacagataaccatctgcggtgataaattatctctggcggtgttgac
  181.    7 ttttgtgctcatacgttaaatctatcaccgcaagggataaatatctaacaccgtgcgtgtt
  182.    8 aacacgcacggtgttagatatttatcccttgcggtgatagatttaacgtatgagcacaaaa
  183.    9 atcaccgcaagggataaatatctaacaccgtgcgtgttgactattttacctctggcggtga
  184.   10 tcaccgccagaggtaaaatagtcaacacgcacggtgttagatatttatcccttgcggtgat
  185.   11 acaccgtgcgtgttgactattttacctctggcggtgataatggttgcatgtactaaggagg
  186.   12 cctccttagtacatgcaaccattatcaccgccagaggtaaaatagtcaacacgcacggtgt
  187.                                           ^
  188.  
  189. Read the numbers on the top vertically.  This is called a "numbar".  Notice
  190. that position +7 always has a T (marked with the ^).  That is, according to
  191. this rather limited data set, one or both of the proteins that bind here always
  192. require a T at that spot.  Since the frequency of T is 1 and the frequencies of
  193. other bases there are 0, H(+7) = 0 bits.  But that makes no sense whatsoever!
  194. This is a position where the protein requires information to be there.  That
  195. is, what is really happeneing is that the protein has two states.  In the
  196. BEFORE state, it is somewhere on the DNA, and is able to probe all 4 possible
  197. bases.  Thus the uncertainty before binding is Hbefore = log2(4) = 2 bits.  In
  198. the AFTER state, the protein has bound and the uncertainty is lower:
  199. Hafter(+7) = 0 bits.  The information content, or sequence conservation, of the
  200. position is Rsequence(+7) = Hbefore - Hafter = 2 bits.  That is a sensible
  201. answer.  Notice that this gives Rsequence close to zero outside the sites.
  202.  
  203. If you have uncertainty and information and entropy confused, I don't think you
  204. would be able to work through this problem.  For one thing, one would get high
  205. information OUTSIDE the sites.  Some people have published graphs like this.
  206.  
  207. A nice way to display binding site data so you can see them and grasp their
  208. meaning rapidly is by the sequence logo method.
  209.  
  210. ***********************************************************
  211.  
  212. |-| How Can I Learn More About Information Theory and Biology?  References
  213.  
  214. REFERENCES - General
  215.  
  216. There are a huge number of papers related to this topic, just about everything
  217. in molecular biology, lots of chemistry, physics, electronics, evolutionary
  218. theory, thermodynamics, statistical mechanics and the kitchen sink ...  You can
  219. get a pretty good overview by combining the references of Schneider.ccmm,
  220. Schneider.edmm and Leff1990.  References are given in BiBTeX format, the
  221. bibliography program associated with LaTeX, the powerful and portable
  222. typesetting program.
  223.  
  224. By arrangement, books that have prices listed can be ordered over Internet from:
  225.   Reiter's Scientific & Professional Books
  226.   2021 K Street, NW
  227.   Washington, DC  20006
  228.   1-800-537-4314
  229.   1-202-223-3327
  230.   1-202-296-9103 FAX
  231.   books@reiters.com
  232.  
  233. Shipping and handling charges are:
  234. in the DC metropolitan area $4.00 for one item, $0.50 for each additional item,
  235. outside the area $4.50 for one item, $0.50 for each additional item.
  236.  
  237. The prices are current as of October 1994; because publishers are constantly
  238. changing their prices, they should be considered estimates rather than
  239. guaranteed prices.  To open an account you must first either phone or FAX them
  240. and provide a credit card number.  Book orders can be then placed at any time
  241. over the Internet.
  242.         **DO NOT SEND CREDIT CARD NUMBERS OVER THE INTERNET!**
  243.  
  244. Reiter's carries all of the books on this list except "Information Theory:
  245. Saving Bits", and that one can be special ordered.  If enough interest in this
  246. book is generated by the FAQ, it will be added as regular stock.  (It can also
  247. be ordered directly from the company using the information given.)
  248.  
  249. # Gonick's Wonderful books (Don't be shy!  They are worth the money!!):
  250.  
  251. @book{Gonick.computers,
  252. author = "L. Gonick",
  253. title = "The Cartoon Guide to Computers",
  254. edition = "second",
  255. publisher = "HarperCollins",
  256. address = "New York, NY",
  257. isbn = "0-06-273097-5",
  258. price = "price as of 1994 October 31: \$11.00",
  259. year = "1991"}
  260.  
  261. @book{Gonick.genetics,
  262. author = "L. Gonick",
  263. title = "The Cartoon Guide to Genetics",
  264. edition = "updated",
  265. publisher = "Barnes \& Nobel",
  266. address = "New York, NY",
  267. isbn = "0-06-273099-1",
  268. price = "price as of 1994 October 31: \$12.00",
  269. year = "1991"}
  270.  
  271. @book{Gonick.physics,
  272. author = "L. Gonick
  273.  and A. Huffman",
  274. title = "The Cartoon Guide to Physics",
  275. publisher = "HarperPerennial",
  276. address = "New York, NY",
  277. isbn = "0-06-273100-9",
  278. price = "price as of 1994 October 31: \$12.00",
  279. year = "1990"}
  280.  
  281. # A good starting point if you don't know much molecular biology:
  282. # (Two volumes)
  283.  
  284. @book{Watson1987,
  285. author = "J. D. Watson
  286.  and N. H. Hopkins
  287.  and J. W. Roberts
  288.  and J. A. Steitz
  289.  and A. M. Weiner",
  290. title = "Molecular Biology of the Gene",
  291. edition = "fourth",
  292. publisher = "The Benjamin/Cummings Publishing Co., Inc.",
  293. address = "Menlo Park, California",
  294. isbn = "0-8053-9614-4",
  295. price = "price as of 1994 October 31: \$59.95",
  296. year = "1987"}
  297.  
  298. # This book describes LaTex and BiBTeX:
  299.  
  300. @book{Lamport1994,
  301. author = "L. Lamport",
  302. title = "\LaTeX: A Document Preparation System,
  303. User's Guide \& Reference Manual",
  304. edition = "second",
  305. publisher = "Addison-Wesley Publishing Company",
  306. address = "Reading, Massachusetts",
  307. isbn = "0-201-52983-1",
  308. price = "price as of 1994 October 31: \$32.95",
  309. year = "1994"}
  310.  
  311. # ***********************************************************
  312. # REFERENCES - Information Theory
  313.  
  314. # The best starter book:
  315.  
  316. @book{Pierce1980,
  317. author = "J. R. Pierce",
  318. title = "An Introduction to Information Theory:
  319. Symbols, Signals and Noise",
  320. edition = "second",
  321. publisher = "Dover Publications, Inc.",
  322. address = "New York",
  323. isbn = "0-486-24061-4",
  324. comment = "
  325. original copyright 1961
  326. Ordering information:  Pierce1980 is currently available by mail from:
  327.    Dover Publications, Inc.
  328.    31 East 2nd street
  329.    Mineola, New York 11501
  330. order:
  331.    Pierce, An Introduction to Information Theory: Symbols, Signals and Noise
  332.    code number: 24061-4
  333. $7.95 + charges.  Payment in full, no telephone or credit card orders.
  334. Postage and Handling charges are:
  335. Bookrate: $3 (US only)
  336. UPS: $4.50 (US only, not Alaska or Hawaii or PO boxes)
  337. Foreign orders: add 20% of total (minimum $2.50)
  338. Sales Tax (Ny residents only)
  339. Foreign Orders Note: Remittances must be sent by international money order or
  340. in U.S. funds via Federal Wire System to Chemical Bank, N. Y.  ABA #021000128.
  341. Mark all remittances `For the account of Dover Publications, Inc.  #001 053
  342. 272'.  This information is from the Dover Math and Science Catalogue 9/92",
  343. price = "price as of 1994 October 31: \$8.95",
  344. year = "1980"}
  345.  
  346. Christopher Hillman (hillman@math.washington.edu) suggests that this one is a
  347. better starting point:  Thomas Cover and Joy A. Thomas, Elements of Information
  348. Theory, Wiley, 1991.  People who have seen both could post their opinions.
  349.  
  350. # A good introduction to the mathematics:
  351.  
  352. @book{Sacco1988,
  353. author = "W. Sacco
  354.  and W. Copes
  355.  and C. Sloyer
  356.  and R. Stark",
  357. title = "Information Theory: Saving Bits",
  358. publisher = "Janson Publications, Inc.",
  359. comment = "original address was Providence, Rhode Island",
  360. address = "Dedham, MA",
  361. isbn = "0-939765-25-X",
  362. phone = "(800) 322-6284",
  363. price = "price as of 1994 October 31: \$11.95",
  364. year = "1988"}
  365.  
  366. # Important originals:
  367.  
  368. @article{Shannon1948,
  369. author = "C. E. Shannon",
  370. title = "A Mathematical Theory of Communication",
  371. year = "1948",
  372. journal = "Bell System Tech. J.",
  373. volume = "27",
  374. pages = "379-423, 623-656"}
  375.  
  376. @book{ShannonWeaver1949,
  377. author = "C. E. Shannon
  378.  and W. Weaver",
  379. title = "The Mathematical Theory of Communication",
  380. publisher = "University of Illinois Press",
  381. address = "Urbana",
  382. isbn = "0-252-72548-4",
  383. price = "price as of 1994 October 31: \$9.95",
  384. year = "1949"}
  385.  
  386. @article{Shannon1949,
  387. author = "C. E. Shannon",
  388. title = "Communication in the Presence of Noise",
  389. year = "1949",
  390. journal = "Proc. IRE",
  391. volume = "37",
  392. pages = "10-21"}
  393.  
  394. # For the committed: The Complete Works!
  395.  
  396. @inproceedings{Shannon1993,
  397. author = "C. E. Shannon",
  398. editor = "N. J. A. Sloane and A. D. Wyner",
  399. booktitle = "Claude Elwood Shannon: Collected Papers",
  400. publisher = "IEEE Press",
  401. address = "Piscataway, NJ",
  402. isbn = "0-7803-0434-9",
  403. comment = "IEEE Order Number: PC0331-9
  404.   To order directly by charge card (eg Visa works) you can call
  405.   (908)-981-0060
  406.   $69.95 + $5 handling charge
  407.   delivery in about 2 weeks",
  408. price = "price as of 1994 October 31: \$69.95",
  409. year = "1993"}
  410.  
  411. # How locks work and other cool stuff:
  412.  
  413. @book{Macaulay1988,
  414. author = "D. Macaulay",
  415. title = "The Way Things Work",
  416. publisher = "Houghton Mifflin Company",
  417. address = "Boston",
  418. isbn = "0-395-42857-2",
  419. price = "price as of 1994 October 31: \$29.95",
  420. comment = "This book is also available on Windows-Compatible CD-ROM
  421.   cdrom isbn = 1-56458-901-3  Price as of 1994 October 31: \$99.95",
  422. year = "1988"}
  423.  
  424. # Leff1990 gives a review of the Maxwell's Demon problem.
  425. # See also Schneider.edmm, listed below.
  426.  
  427. @book{Leff1990,
  428. author = "H. S. Leff and A. F. Rex",
  429. title = "Maxwell's Demon: Entropy, Information, Computing",
  430. publisher = "Princeton University Press",
  431. address = "Princeton, N. J.",
  432. phone = "1(800) 777-4726",
  433. isbn.hard = "0-691-08726-1 (hard cover)",
  434. price.hard = "price as of 1994 October 31: \$80.00",
  435. isbn.paper = "0-691-08727-X (paperback)",
  436. price.paper = "price as of 1994 October 31: \$26.95",
  437. year = "1990"}
  438.  
  439. # ***********************************************************
  440.  
  441. # REFERENCES - Jaynes
  442.  
  443. @article{JaynesI,
  444.   author = "Edwin T. Jaynes",
  445.   title = "Information Theory and Statistical Mechanics",
  446.   year = 1957,
  447.   journal = "Physical Review",
  448.   volume = "106",
  449.   pages = "620-630"}
  450.  
  451. @article{JaynesII,
  452.   author = "Edwin T. Jaynes",
  453.   title = "Information Theory and Statistical Mechanics. {II}",
  454.   year = 1957,
  455.   journal = "Physical Review",
  456.   volume = "108",
  457.   pages = "171-190"}
  458.  
  459. # A version of Jaynes' new book "PROBABILITY THEORY -- THE LOGIC OF SCIENCE"
  460. # is available on the net.  See:
  461. #
  462. # ftp://bayes.wustl.edu/Jaynes.book/
  463. # Larry Bretthorst (larry@bayes.wustl.edu)
  464. #
  465. # http://omega.albany.edu:8008/JaynesBook.html
  466. # Carlos Rodriguez (carlos@math.albany.edu)
  467. #
  468. # Tom Schneider's pointers to these places:
  469. # http://www-lmmb.ncifcrf.gov/~toms/jaynes.html
  470. #
  471. # Note:  The book is being written now and new versions come out every once in a
  472. # while.  One of these locations may be more up to date than the other.
  473.  
  474. # ***********************************************************
  475. # REFERENCES - Schneider
  476.  
  477. @article{Schneider1986,
  478. author = "T. D. Schneider
  479.  and G. D. Stormo
  480.  and L. Gold
  481.  and A. Ehrenfeucht",
  482. title = "Information content of binding sites on nucleotide sequences",
  483. journal = "J. Mol. Biol.",
  484. volume = "188",
  485. pages = "415-431",
  486. year = "1986"}
  487.  
  488. @inproceedings{Schneider1988,
  489. author = "T. D. Schneider",
  490. editor = "G. J. Erickson and C. R. Smith",
  491. title = "Information and entropy of patterns in genetic switches",
  492. booktitle = "Maximum-Entropy and Bayesian Methods in Science and Engineering",
  493. volume = "2",
  494. pages = "147-154",
  495. publisher = "Kluwer Academic Publishers",
  496. address = "Dordrecht, The Netherlands",
  497. year = "1988"}
  498.  
  499. @article{Schneider1989,
  500. author = "T. D. Schneider
  501.  and G. D. Stormo",
  502. title = "Excess Information at Bacteriophage {T7} Genomic Promoters
  503. Detected by a Random Cloning Technique",
  504. year = "1989",
  505. journal = "Nucl. Acids Res.",
  506. volume = "17",
  507. pages = "659-674"}
  508.  
  509. @article{Schneider.Stephens.Logo,
  510. author = "T. D. Schneider
  511.  and R. M. Stephens",
  512. title = "Sequence Logos: A New Way to Display Consensus Sequences",
  513. journal = "Nucl. Acids Res.",
  514. volume = "18",
  515. pages = "6097-6100",
  516. year = "1990"}
  517.  
  518. @article{Schneider.ccmm,
  519. author = "T. D. Schneider",
  520. title = "Theory of Molecular Machines.
  521. {I. Channel} Capacity of Molecular Machines",
  522. journal = "J. Theor. Biol.",
  523. volume = "148",
  524. number = "1",
  525. pages = "83-123",
  526. note = "{(Note: The figures were printed out of order!
  527. Fig. 1 is on p. 97.)}",
  528. year = 1991}
  529.  
  530. @article{Schneider.edmm,
  531. author = "T. D. Schneider",
  532. title = "Theory of Molecular Machines.
  533. {II. Energy} Dissipation from Molecular Machines",
  534. journal = "J. Theor. Biol.",
  535. volume = "148",
  536. number = "1",
  537. pages = "125-137",
  538. year = 1991}
  539.  
  540. @article{Herman.Schneider1992,
  541. author = "N. D. Herman
  542.   and T. D. Schneider",
  543. title = "High Information Conservation Implies that at Least Three Proteins
  544. Bind Independently to {F} Plasmid {{\em incD\/}} Repeats",
  545. journal = "J. Bact.",
  546. volume = "174",
  547. pages = "3558-3560",
  548. year = "1992"}
  549.  
  550. @article{Stephens.Schneider.Splice,
  551. author = "R. M. Stephens
  552.   and T. D. Schneider",
  553. title = "Features of spliceosome evolution and function
  554. inferred from an analysis of the information at human splice sites",
  555. journal = "J. Mol. Biol.",
  556. volume = "228",
  557. pages = "1124-1136",
  558. year = "1992"}
  559.  
  560. @article{Papp.helixrepa,
  561. author = "P. P. Papp
  562.  and D. K. Chattoraj
  563.  and T. D. Schneider",
  564. title = "Information Analysis of Sequences that Bind
  565. the Replication Initiator {RepA}",
  566. journal = "J. Mol. Biol.",
  567. comment = "Cover of 233, number 2!",
  568. volume = "233",
  569. pages = "219-230",
  570. year = "1993"}
  571.  
  572. @article{Schneider.nano2,
  573. author = "T. D. Schneider",
  574. title = "Sequence Logos, Machine/Channel Capacity,
  575. {Maxwell}'s Demon, and Molecular Computers:
  576. a Review of the Theory of Molecular Machines",
  577. journal = "Nanotechnology",
  578. volume = "5",
  579. number = "1",
  580. pages = "1-18",
  581. year = "1994"}
  582. ftp://ftp.ncifcrf.gov/pub/delila/nano2.ps
  583.  
  584. # ***********************************************************
  585. # REFERENCES - Yockey
  586.  
  587. @book{Yockey1958a,
  588. editor = "Hubert P. Yockey and Robert P. Platzman and Henry Quastler",
  589. title = "Symposium on Information Theory in Biology",
  590. booktitle = "Symposium on Information Theory in Biology",
  591. publisher = "Pergamon Press",
  592. address = "New York, London",
  593. comment = "out of print",
  594. year = "1958"}
  595.  
  596. @article{Yockey1981,
  597. author = "Hubert P. Yockey",
  598. year = 1981,
  599. title = "Self-organization Origin of Life Scenarios and Information Theory",
  600. journal = "J. Theor. Biol.",
  601. volume = "91",
  602. pages = "13-31"}
  603.  
  604. @book{Yockey1992,
  605. author = "H. P. Yockey",
  606. title = "Information Theory in Molecular Biology",
  607. publisher = "Cambridge University Press",
  608. address = "Cambridge",
  609. isbn = "0-521-35005-0",
  610. comment = "40 West 20th Street,
  611. New York, N. Y.  10011-4211,
  612. order number 350050",
  613. phone = "1-800-827-7423",
  614. price = "price as of 1994 October 31: \$74.95",
  615. year = "1992"}
  616.  
  617. Following is Hubert Yockey's reference list:
  618.  
  619. Yockey, Hubert P. Information Theory and Molecular Biology, Cambridge UK:
  620. Cambridge University Press (1992)
  621. When is random random? Nature 344 (1990) p823, Hubert P. Yockey
  622. Yockey, Hubert P. (1981). Self-organization origin of life scenarios and
  623. information theory. Journal of Theoretical Biology, 91, 13-31.
  624. Yockey, Hubert P. (1979). Do overlapping genes violoate molecular biology and
  625. the theory of evolution? Journal of Theoretical Biology, 80, 21-26.
  626. Yockey, Hubert P. (1978). Can the Central Dogma be derived from information
  627. theory? Journal of Theoretical Biology, 74, 149-152.
  628. Yockey, Hubert P. (1977a). A prescription which predicts functionally
  629. equivalent residues at given sites in protein sequences. 67, 337-343.
  630. Yockey, Hubert P. (1977b). On the information content of cytochrome c.
  631. Journal of Theoretical Biology, 67, 345-376.
  632.  Yockey, Hubert P. (1977c). A calculation of the probability of spontaneous
  633. biogenesis by information theory. Journal of Theoretical Biology, 67,
  634. 377-398.
  635. Yockey, Hubert P (1974). An application of information theory to the Central
  636. Dogma and the sequence hypothesis. Journal of Theoretical Biology,.46,
  637. 369-406.
  638. Yockey, Hubert P. (1960) The Use of Information Theory in Aging and Radiation
  639. Damage In The Biology of Aging American Institute of Biological Sciences
  640. Symposium No. 6 (160) pp338-347
  641. Yockey, Hubert P., Platzman, Robert P. & Quastler, Henry, eds. (1958a).
  642. Symposium on Information Theory in Biology, New York, London: Pergamon Press.
  643. Yockey, Hubert P. (1958b). A study of aging, thermal killing and radiation
  644. damage by information theory. In Symposium on Information Theory in Biology.
  645. eds. Hubert P. Yockey, Robert Platzman & Henry Quastler, pp297-316. New York,
  646. London: Pergamon Press.
  647. Yockey, Hubert P. (1956). An application of information theory to the physics
  648. of tissue damage. Radiation.Research, 5, 146-155.
  649.  
  650. ***********************************************************
  651.  
  652. |-| Will Authors Send Me Papers?
  653.  
  654. Tom Schneider will mail you copies of his papers.  Send your physical address
  655. to him at toms@ncifcrf.gov.  Some papers are on line already, see also the
  656. README file in the ftp archive ftp.ncifcrf.gov in pub/delila.
  657.  
  658. If you are willing to send out papers or have papers you would like listed
  659. here, please contact Tom Schneider.
  660.  
  661. You can request them by Mosaic from the page
  662. http://www-lmmb.ncifcrf.gov/~toms/papers.html
  663.  
  664. ***********************************************************
  665.  
  666. |-| How Do I find Sequence Logos on the Web?
  667.  
  668. http://www-lmmb.ncifcrf.gov/~toms/sequencelogo.html
  669.  
  670. ***********************************************************
  671.  
  672. |-| Is There a Shell Script for Making Sequence Logos?
  673.  
  674. Yes, you will find the one Shmuel Pietrokovski wrote in the ftp archive
  675. ftp.ncifcrf.gov in pub/delila/logoaid.  (Also available in
  676. bioinformatics.weizmann.ac.il/pub/software/logoaid.)
  677. ***********************************************************
  678.  
  679. |-| Is There a Mosaic Page for Making Sequence Logos?
  680.  
  681. Yes, Steve Brenner has done it!
  682.  
  683. http://www.bio.cam.ac.uk/seqlogo/
  684.  
  685. ***********************************************************
  686.  
  687. |-| Can You Just Point My Mosaic To The FAQ and the Archives?
  688.  
  689. This file and the postings may be obtained by Mosaic through the world wide web
  690. at:
  691.  
  692. <UL>
  693.  
  694. <H2>
  695. <LI> <A HREF="ftp://ftp.ncifcrf.gov/pub/delila/bionet.info-theory.faq.Z">
  696. FAQ (Frequently Asked Questions)</A>
  697. about the Biological Information Theory and Chowder Society
  698. </H2>
  699.  
  700. <H2>
  701. <LI> <A HREF="gopher://net.bio.net/11/BIO-INFO">
  702. Gopher Link to Archive of All Postings.</A>
  703. This archive contains the most recent postings
  704. as separate documents.</H2>
  705.  
  706. <H2>
  707. <LI> <A HREF="ftp://net.bio.net/pub/BIOSCI/BIO-INFO">
  708. Archive of Monthly Postings.</A>
  709. This archive (currently) contains postings
  710. from each month as a single document.</H2>
  711.  
  712. <H2>
  713. <LI> <A HREF="ftp://ftp.bio.indiana.edu/usenet/bionet/info-theory/">
  714. Gopher link to Archive of Postings at IUBO.</A>
  715. This archive contains individual postings.
  716. Older postings are collected by the month as a single document.
  717. There is an index for each month.
  718. </H2>
  719.  
  720. </UL>
  721.  
  722. ***********************************************************
  723.  
  724. |-| How Do I obtain bionet.info-theory BY EMAIL?
  725.  
  726. If you have access to USENET news YOU DO NOT NEED AN E-MAIL SUBSCRIPTION!!  We
  727. strongly encourage all interested users to explore getting USENET news at your
  728. site.  It's MUCH easier on you than an e-mail subscription!  Please consult
  729. your systems manager or contact biosci-help@net.bio.net for assistance if
  730. needed.
  731.  
  732. The BIOSCI (email) name for the forum is BIO-INFO.
  733.  
  734. Depending on where you are, you have to do different things to subscribe or be
  735. removed from the email subscription list:
  736.  
  737. SUBSCRIBING / UNSUBSCRIBING
  738.    North or South America or Pacific Rim:
  739.      Using the computer account in which you want to receive mail
  740.      messages, please send an email message to the e-mail server at
  741.      biosci-server@net.bio.net.  Leave the Subject: line blank.
  742.      In the body of the message include the line
  743.  
  744.      subscribe bio-info
  745.  
  746.      to add yourself to the mailing list or
  747.  
  748.      unsubscribe bio-info
  749.  
  750.      to cancel an existing subscription.  If you need personal
  751.      subscription assistance, please contact biosci-help@net.bio.net.
  752.  
  753.    Europe, Africa, and Central Asia:
  754.        Send a email message to the person at
  755.       biosci@daresbury.ac.uk
  756.    requesting a subscription or removal from the BIO-INFO forum.
  757.  
  758. SENDING OUT POSTINGS
  759. Thereafter, address email messages for this forum to one of:
  760.  
  761.    North or South America or Pacific Rim:
  762.       bio-info@net.bio.net
  763.  
  764.    Europe, Africa, and Central Asia:
  765.       bio-info@daresbury.ac.uk
  766.  
  767. You can post to either of the above address if you want.  We only request that
  768. you sign up at your local node in order to optimize the use of the network
  769. resources for message distribution.
  770.  
  771. Do not send subscription requests to any of these addresses, or you will have
  772. sent it to everybody on the planet (to your great embarrassment, and we will
  773. drub you with food cake)!  Let me say that again:  please do not post requests
  774. for subscription or being removed from the list to the list itself, that takes
  775. up bandwidth all over the world!
  776.  
  777. If you have problems, contact the subscription site manager who you signed up
  778. with.  If your problem is not resolved, please contact
  779. biosci-help@net.bio.net.
  780.  
  781. DO NOT CONTACT TOM SCHNEIDER FOR SUBSCRIPTIONS OR UNSUBSCRIBING!
  782.  
  783. ***********************************************************
  784.  
  785. |-| Where Did I Get This FAQ File From Originally?
  786.  
  787. The latest version of this FAQ is stored in the anonymous ftp archive
  788. ftp.ncifcrf.gov in pub/delila under the name bionet.info-theory.faq and also as
  789. bionet.info-theory.faq.Z (The .Z means it is compressed; remember to use the
  790. binary transfer mode if you pick up the latter.  See the uncompressed README
  791. file in the archive for where to get the uncompress program if you need it.)
  792. Please send questions and comments to: Tom Schneider toms@ncifcrf.gov
  793.  
  794. This file is also posted monthly on news.answers and bionet.info-theory.
  795.  
  796. ***********************************************************
  797.  
  798. |-| What is the IP number of the FAQ archive?
  799.  
  800. For ftp.ncifcrf.gov you can use 129.43.1.11
  801.  
  802. ***********************************************************
  803. |-| Where Are the Bionet Archives?
  804.  
  805. The entire collection of BIOSCI/bionet messages from inception are
  806. available via the biosci.src WAIS source at net.bio.net.  Contact
  807. biosci-help@net.bio.net for further help with accessing this WAIS source.
  808.  
  809. FTP archives of all the BIOSCI/bionet messages are available at net.bio.net
  810. [134.172.2.69] in /pub/BIOSCI.  bionet.info-theory is in pub/BIOSCI/BIO-INFO.
  811. Files are in mailbox format, with names of the form YYMM (YY=last 2 digits of
  812. the year, MM=cardinal number of the month, zero padded).  The current months
  813. postings are in the file 'current'.  Contact biosci-help@net.bio.net for
  814. further help with or comments on the archives.
  815.  
  816. All the bionet.* newsgroups, including info-theory, are also archived for
  817. Gopher retrieval from the IUBIO Gopher hole and for anonymous ftp from
  818. ftp.bio.indiana.edu, directory usenet/bionet/...
  819.  
  820. The archives can be accessed by gopher or ftp running under the Mosaic
  821. interface.  The URL (Universal Record Locator) for gopher is:
  822.    gopher://net.bio.net/11/BIO-INFO
  823. This gives individual postings.  By ftp one can use:
  824.    ftp://net.bio.net/pub/BIOSCI/BIO-INFO
  825. Unfortunately this gives the entire month in a single document.
  826.  
  827. ***********************************************************
  828.  
  829. |-| What Can I Do About Inappropriate Postings?
  830.  
  831. The short form of this news group's name, bio-info, can be a little confusing
  832. to some people inexperienced in network communications or with little knowledge
  833. of the discipline (if there is any :-) of biological information theory.  It
  834. can and has been mistaken as a news group for general biological information.
  835. Our readers should be aware that when such postings come to our attention, we
  836. do attempt to inform, privately, the people who make these inappropriate
  837. postings of the error of their ways and suggest alternative or more appropriate
  838. venues.
  839.  
  840. Subjecting the writers of inappropriate posting to public excoriation is not a
  841. good policy because the mistake is usually inadvertent and the follow-up
  842. postings add further to the irritation of our regular readers.  When others
  843. publicly reply to such posts in this news group, although they may think they
  844. are being polite to the original poster, they are still annoying our regular
  845. readers.  We suggest that a better policy for readers who do wish to reply to
  846. inappropriate posts is to do so privately or to an appropriate news group.
  847.  
  848. For further information about how to deal with intransigent netidiots, see:
  849. http://math-www.uni-paderborn.de/~axel/blacklist.html
  850.  
  851. ***********************************************************
  852.  
  853. |-| What is the official word on copyright of this FAQ?
  854.  
  855. This FAQ fits the description in the U. S. Copyright Act of a "United States
  856. Government work".  It was written as a part of my official duties as Government
  857. employee.  This means it cannot be copyrighted.  The article is freely
  858. available without a copyright notice, and there are no restrictions on its use,
  859. now or subsequently.  I retain no rights in the FAQ.
  860.  
  861. Thomas D. Schneider
  862.  
  863. ***********************************************************
  864.  
  865. |-| Who Takes Care of This Group?
  866.  
  867. John S. Garavelli
  868. Protein Information Resource
  869. National Biomedical Research Foundation
  870. Washington, DC  20007
  871. garavelli@gunbrf.bitnet
  872.  
  873. Tom Schneider
  874. National Cancer Institute
  875. Laboratory of Mathematical Biology
  876. Frederick, Maryland  21702-1201
  877. toms@ncifcrf.gov
  878.  
  879. John L. Spouge
  880. National Center for Biotechnology Information
  881. National Library of Medicine
  882. Bethesda, MD  20894
  883. spouge@frodo.nlm.nih.gov
  884.  
  885. Please email comments and suggestions on this faq sheet to Tom.
  886.  
  887. John Garavelli (who also answers to "Steve" if you want to avoid confusion)
  888. often organizes dinner speakers.
  889.  
  890. John Spouge often arranges dinner locations.
  891.  
  892. ***********************************************************
  893.